到目前為止我們算是把 Binary Classification 中和 MLOps 有關的部分講告一個段落了,昨天做後講到關於 Computer Vision 和 Natural Language,所以在進入整理之前,我們三天的時間來講一下 Unstructured Data
非結構化數據在當今的數據世界中佔有越來越重要的地位。不外乎三個格式, Image, Audio 和 Test,當然 Unboding Sequence 也算是一種非結構化數據,在非結構化數據常會有以下的問題
依照我們先前提到的 MLOps 架構下有幾個項目會需要做些更動
上面都是些很概念性的描述,但我認為在做 Unstructure Data 的
Modeling 時,不要太快地去享用一套方法套用在所有模型上,畢竟模型的變化差異很大,而是先專注在完善特定的應用,舉最近的 LLM 為例子,就發展相對應的 LLMOps,這個我們在後天會稍微提到
另外在 Unstructured Data 中,由於計算量變大了,更會去注重 Inference 和 Training 的計算效能,因此接下來會來講一下 Inference Server 這一塊